استخراج اطلاعات از ویکی پدیا و گسترش شبکه واژگانی فارسی با نمونه ها جهت استفاده در یک سامانه پرسش و پاسخ به زبان فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی
- نویسنده الهام فکری
- استاد راهنما نوشین ریاحی مهرنوش شمس فرد
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
هدف تحقیق صورت گرفته، ارائه یک بستر اطلاعاتی است که بتواند در یک سامانه پرسش و پاسخ به زبان فارسی مورد استفاده قرار گیرد و پرسش های با انواع تعریف شده را بتواند پاسخ دهد. دامنه اطلاعات استخراج شده و در نتیجه پرسش های قابل پاسخگویی از نظر موضوع محدود نبوده و به عبارتی عام می باشد. یک دسته پرکاربرد از سامانه های پرسش و پاسخ، دسته ای هستند که روی پرسش از حقایق متمرکزند. پرسش و پاسخ در این سامانه ها روی مواردی چون افراد، مکان ها، وقایع و ... صورت می گیرد که با نام نمونه ها معروف اند. نمونه ها موجودیت هایی متعلق به یک کلاس پدر می باشند که در صورتی که با دیدگاه هستان شناسانه به آنها بنگریم در سلسله مراتب هستان شناسی در برگ قرار می گیرند و فرزندی نخواهند داشت. یک منبع مناسب در پاسخگویی به پرسش های عمومی دانشنامه ها هستند از ویکی پدیا به عنوان یک دانشنامه آزاد و حاوی مقالات در موضوعات مختلف استفاده شده است. منبع دیگر قابل استفاده در پرسش و پاسخ، هستان شناسی های عمومی هستند که شبکه واژگانی فارسی (فارس نت) به عنوان نمونه ای از این دسته مورد استفاده قرار گرفته است. فارس نت حاوی واژگان عمومی فارسی در قالب دسته های هم معنا می باشد که بین این دسته ها روابط مختلف و از جمله روابط سلسله مراتبی وجود دارد. تعداد نمونه های موجود در فارس نت محدود می باشد و از این رو به تنهایی در پرسش و پاسخ کافی نمی باشد و لازم است با نمونه ها گسترش یابد. از این رو بستر اطلاعاتی به منظور استفاده در سامانه پرسش و پاسخ تهیه می شود که متشکل از فارس نت توسعه یافته با نمونه-ها می باشد. بدین ترتیب که با استفاده از مقالات ویکی پدیای فارسی که حاوی نمونه های بسیاری از کلاس های موجود در فارس نت می باشد، نمونه ها و اطلاعات آنها استخراج شده و به کلاس پدر خود در فارس نت متصل می شود. همچنین برای نمونه های اضافه شده اطلاعاتی چون زوج های صفت-ارزش، یک جمله توضیحی و مفاهیم مرتبط با آن در فارس نت استخراج می شود. روی بستر اطلاعات فراهم شده یک مولفه پرسش و پاسخ با قابلیت پاسخ به سه نوع مشخص از پرسش ها قرار می گیرد. این انواع، پرسش از چیستی، پرسش از نمونه ها و پرسش از ارزش های صفات می باشند. از قابلیت های بستر اطلاعاتی فراهم شده این است که به دلیل اینکه نمونه های استخراج شده به یک شبکه واژگانی متصل شده اند، می توان از ویژگی های شبکه واژگانی در فهم پرسش و همچنین ارائه پاسخ استفاده کرد و بدین ترتیب به پرسش های پیچیده ای که نیاز به نوعی استنتاج دارند پرداخت.
منابع مشابه
ارایه یک پیکره پرسش و پاسخ مذهبی در زبان فارسی
Question answering system is a field in natural language processing and information retrieval noticed by researchers in these decades. Due to a growing interest in this field of research, the need to have appropriate data sources is perceived. Most researches about developing question answering corpus area have been done in English so far, but in other languages as Persian, the lack of these co...
متن کاملمقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure
کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...
متن کاملتاثیرپذیری زبان وادب بلوچی از زبان و ادبیات فارسی و ارتباط واژگانی آن ها
زبان بلوچی یکی از زبان های ایرانی است که قدمتی دیرینه دارد. زبان و ادب فارسی از قرن ها پیش بر زبان و ادب بلوچی، تأثیر فراوانی گذاشته است. مردم بلوچ، فارسی را زبانی مقدس میدانستهاند و این زبان چندین قرن، مستقیم و نیرمستقیم بر ادب و اجتماع بلوچستان تأثیرگذار بوده است. این تأثیر و جایگاه سبب شده است که ارتباط واژگانی بلوچی با فارسی ارتباتی تنگاتنگ باشد. البته به دلیل همسایگی بلوچان با سرزمین خراسا...
متن کاملبازتحلیل واژگانی، جلوهای از فارسی سازی وام واژهها در زبان فارسی؛ یک بررسی ساختاری
بازتحلیل واژگانی، یکی از جلوههای بومیسازی است که در اثر ناآگاهی افراد از ریشة واژه، رخ میدهد. در بازتحلیل واژگانی، جزئی از وامواژه بر اساس شباهت ظاهری، با یک تکواژ یا واژه مشابه، اشتباه گرفته میشود و با آن جایگزین میشود. پدیده بومیسازی در هر زبانی با توجه به قواعد خاصِ آن زبان، شکل ویژهای به خود میگیرد و در پی آن نامی مرتبط با اسم همان زبان، بر آن گذارده میشود. بنابراین دراین مقاله، بو...
متن کاملتحلیل واژگانی افعال زبان فارسی
دستور زبان نویسان و پژوهشگران زبان و ادب فارسی تمام افعال این زبان را بی قاعده فرض نموده ومعتقدند که هر فعل در زبان فارسی دو ریشه یا ماده دارد : ریشه گذشته و ریشه حال .صیغه هایی که برگذشته دلالت دارند ‘از ریشه گذشته و صیغه هایی که بر حال و آینده دلالت دارند ‘از ریشه حال مشتق می شوند . مقاله حاضر‘کوششی است برای اثبات این امر که تعداد قابل توجهی از افعال زبان فارسی ‘ همانند افعال زبان انگلیسی با...
متن کاملزبان فارسی و گسترش اسلام در چین
زبان فارسی برای مدتی طولانی زبان فرهنگی و عبادی مسلمانان چین بود. نشانههای تاریخی از قبیل کتیبهها و سنگ نوشتههای فارسی، تعداد قابل توجه نسخههای خطی فارسی و اسناد غنی کتابهای چینی و همچنین ادامه رواج زبان فارسی در اصطلاحات روزمره در میان مسلمانان چین و بعضی واژههای دیگر فارسی که از قدیم وارد زبان چینی شده، جملگی نشان میدهد که فارسی در تاریخ چین دورانی پر رونق داشته است. در اینجا این سوال...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023